Lịch sử Tối ưu hóa công cụ tìm kiếm

Năm 1990, các công cụ tìm kiếm đầu tiên (như ALIweB) lập danh mục các website, các quản trị viên website chỉ cần gửi URL của trang tới các công cụ tìm kiếm khác nhau để được thu thập dữ liệu, trích xuất liên kết đến các trang khác từ website bằng Trình thu thập dữ liệu web (Web Crawler) để được lưu và sắp xếp trong bộ dữ liệu của họ. Song song đó, một chương trình, được gọi là bộ chỉ mục (indexer), sẽ trích xuất thông tin về trang để thu thập về sau, như các từ chứa, vị trí và mật độ từng từ trong trang, cũng như tất cả các liên kết mà trang chứa.[4]

Đến năm 1997, các lập trình viên của công cụ tìm kiếm như Altavista và Infoseek đã nhận ra các nhà quản trị website có thể đưa ra thông tin khác với nội dung thực [5] hay thao túng một số thuộc tính trong nguồn HTML để tăng thứ hạng website [6]. Do đó, họ đã phát triển các thuật toán xếp hạng phức tạp hơn, có tính đến các yếu tố bổ sung mà các quản trị website khó thao tác hơn để ngăn chặn [7]. Điều này rất quan trọng để tránh việc tạo ra kết quả tìm kiếm kém chất lượng hoặc không liên quan có thể khiến người dùng chuyển sang các nguồn tìm kiếm khác.

Hơn nữa, một số công cụ tìm kiếm cũng chủ động tiếp cận ngành công nghiệp SEO bằng cách trở thành nhà tài trợ và khách mời thường xuyên tại các hội nghị, webchats và hội thảo về SEO, cung cấp thông tin và hướng dẫn tối ưu hóa website.[8][9] Ví dụ: Google có chương trình Sơ đồ website (Sitemaps) để giúp quản trị viên web tìm hiểu nếu Google gặp bất kỳ sự cố nào khi lập danh mục các website và cung cấp dữ liệu về lưu lượng truy cập website từ Google [10]; công cụ quản trị website Bing cung cấp cách để quản trị viên gửi sơ đồ và nguồn cấp dữ liệu web, cho phép người dùng xác định "tốc độ thu thập dữ liệu" và theo dõi trạng thái xếp hạng của website.

Mối quan hệ với Google:

Là một trong các công cụ tìm kiếm phổ biến nhất hiện nay, cách thức Google đánh giá và xếp hạng website tác động rất lớn tới SEO. Năm 1998, Sergey BrinLarry Page đã cho ra đời Google [11] và thu hút được một lượng người theo dõi trung thành cùng sự phát triển của Internet. Google hạn chế bị thao túng như các công cụ tìm kiếm khác chỉ xem xét các yếu tố on-page (như tần suất từ ​​khóa, thẻ meta, tiêu đề, liên kết và cấu trúc website) nhờ kết hợp cả yếu tố off-page (như Hyperlink, PageRank). PageRank, công thức toán học đánh giá giá trị của trang thông qua việc xem xét số lượng, chất lượng của các trang liên kết đến nó [12]. Một trang có PageRank cao hơn có khả năng được truy cập bởi người lướt web ngẫu nhiên.

Vào 2007, Saul Hansell của New York Times cho biết Google sử dụng hơn 200 điều kiện khác nhau khi xếp hạng các website [13], không tiết lộ các thuật toán họ sử dụng để xếp hạng các trang. Google đã công bố một chiến dịch chống lại các backlink [14] chuyển đổi PageRank bằng cách sử dụng thuộc tính nofollow (không theo dõi) trên các liên kết, Googlebot sẽ không còn xử lý bất kỳ liên kết nofollow nào [15].

Tháng 12 năm 2009, Google tuyên bố sử dụng lịch sử tìm kiếm trên web của tất cả người dùng để đưa ra kết quả tìm kiếm phù hợp [16]. Vào ngày 8 tháng 6 năm 2010, Google sử dụng hệ thống xếp hạng website mới có tên Google Caffeine, cho phép người dùng tìm thấy kết quả tin tức, bài đăng trên diễn đàn và nội dung khác nhanh hơn nhiều so với trước đây [17]. Google Instant, trình duyệt tìm kiếm theo thời gian thực (realtime-search), được giới thiệu vào cuối năm 2010 nhằm nỗ lực để làm cho kết quả tìm kiếm kịp thời và liên quan hơn.[18]

Vào 02/2011, Google đã công bố bản cập nhật Panda, trong đó xử phạt các website chứa nội dung trùng lặp từ các website và nguồn khác.[19] Google Penguin 2012 đã nỗ lực xử phạt các website sử dụng các kỹ thuật thao túng để cải thiện thứ hạng của họ trên công cụ tìm kiếm, nó tập trung vào các liên kết spam bằng cách đo lường chất lượng của các liên kết đến các trang.[20]

Vào 10/2019, Google tuyên bố họ sẽ bắt đầu áp dụng các mô hình BERT, dự định kết nối người dùng dễ dàng hơn với nội dung có liên quan và tăng chất lượng lưu lượng truy cập đến các website được xếp hạng trong trang kết quả của công cụ tìm kiếm.[21][22]

Liên quan

Tài liệu tham khảo

WikiPedia: Tối ưu hóa công cụ tìm kiếm http://www.google.com/analytics/ http://www.nytimes.com/2011/02/13/business/13searc... http://searchengineland.com/newspapers-amok-new-yo... http://www.thinkpink.com/bp/Thesis/Thesis.pdf http://help.yahoo.com/l/us/yahoo/search/basics/bas... http://users.monash.edu/~lloyd/tilde/InterNet/Sear... http://ilpubs.stanford.edu:8090/347/ http://infolab.stanford.edu/~backrub/google.html https://www.bing.com/webmaster/help/webmaster-guid... https://googleblog.blogspot.com/2009/12/personaliz...